سیستم شناسایی و طبقه‌بندی موجودیت‌های اسمی در متون زبان فارسی بر پایه شبکه عصبی

Authors

Abstract:

Named Entity Recognition (NER) is a fundamental task in natural language processing and also known as a subset of information extraction. We seek to locate and classify named entities in text into predefined categories such as the names of persons, organizations, locations, expressions of times, etc. Named Entity Recognition for English texts has been researched widely for the past years, however only a few limited researches have emphasized on Persian NER due to the absence of resources for Persian named entities and the limited amount of progress made in Persian natural language processing in general. In this paper, a Persian named entity recognition system has been developed based on neural network with the study of researches conducted in other languages and benefiting from the latest methods in this area such as using the vector representation of words. The results from the proposed model show that word embedding features in Persian not only resolve the problem of feature selection, but also it could lead to the development of an efficient system with the least dependence to the domain.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

سیستم شناسایی و طبقه بندی اسامی در متون فارسی

Name entity recognition (NER) is a system that can identify one or more kinds of names in a text and classify them into specified categories. These categories can be name of people, organizations, companies, places (country, city, street, etc.), time related to names (date and time), financial values, percentages, etc. Although during the past decade a lot of researches has been done on NER in ...

full text

شیوه‌های بیان گزاره اسمی در زبان روسی و فارسی

مقالة حاضر، به بررسی گزارة اسمی در زبان روسی و فارسی می‌پردازد. مفهوم گزاره و انواع آن مدت زمان مدیدی است که مورد بررسی دانشمندان و دستورنویسان می‌باشد. به هنگام بررسی گزارة اسمی در زبان روسی می‌بایست این نکته را خاطرنشان ساخت که در رابطه با ابن موضوع اختلاف نظرهای اساسی وجود دارد. در بحث مربوط به تئوری گزاره در زبان فارسی همچون زبان روسی، نقاط ضعف و نارسایی‌هایی نیز وجود دارد. در این مقاله، ان...

full text

سلسله‌مراتب دسترسی گروه اسمی: فراگیری بندهای موصولی در زبان فارسی

کینان و کامری (1977) پس از بررسی 50 زبان، نظریۀ سلسله‌مراتب دسترسیِ گروه اسمی را معرفی کردند. در این نظریه ادعاشده‌است که زبان‌ها به‌طور جهانی برای موصولی‌سازی از یک سلسله‌مراتب پیروی می‌کنند. بر این اساس، محققان فراگیری زبان فرضیه‌ای را مطرح کردند که بر پایۀ آن، می‌توان ترتیب دشواریِ فراگیریِ بندهای موصولی در زبان دوم را پیش‌بینی کرد. در این مقاله سعی بر آن است تا با بررسی زبانِ میانیِ فارسی آموزان...

full text

بررسی باهمایی ترکیبات پایدار فعلی- اسمی در زبان روسی و مقایسة آن با زبان فارسی

توضیح برخی پدیده‌های زبانی گاهی بسیار دشوار و پیچیده می‌شود، از جمله اینکه چرا در یک زبان، برخی واژگان یا ترکیب خاصی از واژگان وجود دارد یا چرا یک زبان دارای ساختار دستوری، صرفی یا نحوی ویژة خود است. تمامی این پدیده‌ها حاصل فرایند درازمدت رشد و گسترش زبان است. هر فردی بی‌آنکه راجع به آنچه می‌خواهد بگوید تفکر کند، واژگان را در ساختار جمله‌های کامل به‌کار می‌برد. به‌همین ترتیب، در گفتار خود از تر...

full text

پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی

Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...

full text

واژه‌های پایه‌ی زبان فارسی مبتنی‌بر متون مطبوعاتی

آموزش واژه‌های زبان، یکی از مهم‌ترین مؤلفه‌های آموزش زبان خارجی است که می‌تواند هر چهار مهارت اصلی زبان (شنیداری، گفتاری، خواندن و نوشتن) را تحت تأثیر قرار دهد. بر پایة پژوهش‌هایی که در حوزۀ آموزش واژه انجام شده‌است، واژه‌های پربسامد و پایة زبان، به دلیل فراگیری آسان و کاربرد فراوان در زبان روزمره، از اهمیت ویژه‌ای برخوردار هستند. فهرست واژه‌های پربسامد یا پایه، مجموعه‌ای از واژه‌هاست که در پیک...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 34  issue 1

pages  473- 486

publication date 2018-12

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023